Loading...
机构名称:
¥ 1.0

摘要。我们介绍了Diff-Tracker,这是一种利用预先训练的文本到图像扩散模型的无监督视觉跟踪任务的新方法。我们的主要思想是利用预先训练的扩散模型中封装的丰富知识,例如对图像语义和结构信息的不明显,以解决无监督的视觉跟踪。为此,我们设计了一个初始提示学习者,以使扩散模型通过学习代表目标的提示来识别跟踪目标。此外,为了促进提示对目标动作的提示,我们提出了一个在线提示更新程序。在五个基准数据集上进行的大量实验证明了我们提出的方法的有效性,这也可以实现最先进的性能。

arxiv:2407.08394v2 [CS.CV] 16 Jul 2024

arxiv:2407.08394v2 [CS.CV] 16 Jul 2024PDF文件第1页

arxiv:2407.08394v2 [CS.CV] 16 Jul 2024PDF文件第2页

arxiv:2407.08394v2 [CS.CV] 16 Jul 2024PDF文件第3页

arxiv:2407.08394v2 [CS.CV] 16 Jul 2024PDF文件第4页

arxiv:2407.08394v2 [CS.CV] 16 Jul 2024PDF文件第5页

相关文件推荐

2024 年
¥1.0